Появилась идея, как получать много, очень много негативных примеров перефразировок для
siamese network. причем с минимумом ручной работы или модерации.
Для этого берем результаты обработки текстов
моим синтаксическим парсером. Много мегабайтов текстов, и много гигабайтов результатов в XML.
Обрабатываем их в
C# программе (исходнички на гитхабе),
(
Read more... )